تشخیص هوشمند و خودکار غلط های تایپی در پایگاه داده های بزرگ بدون استفاده از لغت نامه

نویسندگان

الناز زعفرانی معطر

دانشگاه آزاد اسلامی واحد تبریز - گروه مهندسی کامپیوتر محمدرضا فیضی درخشی

دانشگاه تبریز - دانشکده مهندسی برق و کامپیوتر - گروه مهندسی کامپیوتر آزاده روحانی

دانشگاه آزاد اسلامی واحد خسروشاه - گروه مهندسی کامپیوتر

چکیده

غلط های تایپی یکی از مشکلات مهم در سیستم های کامپیوتری و سیستم های پایگاه داده ای است. وجود غلط های تایپی در پایگاه داده ها نه تنها از نظر صحت پایگاه داده مشکل ساز هستند، بلکه باعث می شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث می شود که کاربر مجدداً همان رکورد را وارد پایگاه داده نماید که منجر به وجود آمدن افزونگی می گردد. روش های موجود تشخیص غلط ها، مبتنی بر لغت نامه هستند. بدین معنی که از یک لغت نامه بزرگ که همه لغات آن صحیح فرض می شوند استفاده می کنند و اگر کلمه ای در لغت نامه نباشد به عنوان غلط تایپی شناخته می شود. تهیه لغت نامه ای بزرگ و با دقت بالا بسیار پرهزینه و زمان بر است. به علاوه چنین لغت نامه ای مختص یک زمینه خاص (مثلاً محیط پزشکی) است و قابل استفاده و در زمینه های دیگر (مثلاً جامعه شناسی) نیست. در این مقاله روشی ارائه می شود که بدون نیاز به لغت نامه می تواند غلط های تایپی را تشخیص دهد. روش پیشنهادی با چند معیار مرسوم ارزیابی شده است. نتایج آزمایش ها نشان دهنده دقت 93.5 درصدی برای این روش است. علاوه بر دقت بالای روش پیشنهادی، عدم نیاز به لغت نامه یک ویژگی منحصر به فرد برای آن به شمار می رود.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص هوشمند و خودکار غلط‌های تایپی در پایگاه‌داده‌های بزرگ بدون استفاده از لغت‌نامه

غلط‌های تایپی یکی از مشکلات مهم در سیستم‌های کامپیوتری و سیستم‌های پایگاه‌داده‌ای است. وجود غلط‌های تایپی در پایگاه‌داده‌ها نه تنها از نظر صحت پایگاه‌داده مشکل‌ساز هستند، بلکه باعث می‌شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث می‌شود که کاربر مجدداً همان رکورد را وارد پایگاه‌داده نماید که منجر به وجود آمدن افزونگی می‌گردد. روش‌های موجود تشخیص غلط‌ها، مبتنی بر لغت‌ن...

متن کامل

تصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی

Automatic correction of typos in the typed texts is one of the goals of research in artificial intelligence, data mining and natural language processing. Most of the existing methods are based on searching in dictionaries and determining the similarity of the dictionary entries and the given word. This paper presents the design, implementation, and evaluation of a Farsi typo correction system u...

متن کامل

یک پایگاه داده به منظور استفاده در سامانه هوشمند تشخیص شخصیت

گرافولوژی ، علم مطالعه و بررسی شخصیت و خصوصیات فردی بر اساس نوشتن است. آگاهی از این علم میتواند موارد استفاده زیادی در جامعه داشته باشد. در این مقاله، یک پایگاه داده دست نوشته های فارسی برای گرافولوژی و تشخیص هوشمند شخصیت معرفی میشود. داده های جمع آوری شده شامل 140 نمونه دستخط از دو گروه دانشجویان دانشگاه جامع علمی کاربردی و مددجویان زندان شهر سمنان میباشد. ضمن اخذ دستخط، افراد شرکت کننده در ا...

متن کامل

الگوریتم های هوشمند تطابق چهره در پایگاه داده های بزرگ

تطابق چهره بصورت خودکار یکی از کارهای چالش برانگیزی است که در دهمه اخیر توجه زیادی را به خود جلب کرده است. الگوریتم های مختلفی برای تطابق چهره وجود دارند. کارایی این الگوریتم ها روی پایگاه داده های مختلف آزمایش شده است. برای اینکه این الگوریتم ها قابل پیاده سازی و استفاده باشند، باید بتوان از آنها روی پایگاه داده های بززگ استفاده کرد. هنگام اجرا روی پایگاه داده های بزرگ علاوه بر کارایی، زمان اج...

15 صفحه اول

تصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی

ارایه راهی برای تصحیح غلط های املایی نگاشته شده توسط انسان یکی از اهداف مورد توجه در دانش هوش مصنوعی، متن کاوی و پردازش زبان طبیعی است. بیشتر روش های موجود برای تصحیح غلط های املایی بر پایه الگوریتم های جست وجو در فرهنگ واژگان و تعیین نسبت شباهت واژگان درست موجود در فرهنگ واژگان با واژه نادرست مورد نظر کار می کنند. در این پژوهش طراحی، پیاده سازی و ارزیابی یک مصحح املایی به کمک شبکه های عصبی مصن...

متن کامل

نارسایی های لغت نامه های روسی به فارسی چاپ ایران

با توجه به اهمیت فرهنگ نویسی، در یک فعالیت تحقیقی فشرده بر آن بوده ایم، وضعیت لغت نامه های روسی- فارسی را بررسی و رویهء استاندارد مناسبی برای تجدید نظر در جهت أرتقاء آن ها جستجو و معرفی کنیم، بررسی های ما نشان می دهد که در لغت نامه های روسی- فارسی , نواقص متعدإی وجودد ارد. اهمیت لغت نامه های تشریحی، دو زبانه، بسامدی، دستوری و متنی در آن است که این ها به عنوان منابع بنیادین، مصالح أولیهء فعال...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مهندسی برق دانشگاه تبریز

جلد ۴۷، شماره ۱، صفحات ۸۱-۹۱

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023